迄今为止,游戏中的学习研究主要集中在正常形式游戏上。相比之下,我们以广泛的形式游戏(EFG),尤其是在许多代理商远远落后的EFG中对学习的理解,尽管它们与许多现实世界的应用更加接近。我们考虑了网络零和广泛表单游戏的天然类别,该游戏结合了代理收益的全球零和属性,图形游戏的有效表示以及EFG的表达能力。我们检查了这些游戏中乐观梯度上升(OGA)的收敛属性。我们证明,这种在线学习动力学的时间平均值表现出$ O(1/t)$ rate contergence convergence contergence contergence。此外,我们表明,对于某些与游戏有关的常数$ c> 0 $,日常行为也与速率$ o(c^{ - t})$收敛到nash。
translated by 谷歌翻译
在本文中,我们解决了普通游戏中无遗憾的学习问题。具体而言,我们提供了一种简单实用的算法,实现了固定的阶梯大小的恒定遗憾。随着阶梯大小的增加,我们的算法的累积遗憾可被线性降低。我们的调查结果离开了现行范式,即消失的阶梯尺寸是迄今为止所有最先进的方法的低遗憾的先决条件。通过定义我们称之为Clairvoyant乘法权重更新(CMWU)的小说算法,从此范例转移到此范式。 CMWU是配备有精神模型的乘法权重更新(MWU),其在下一个时期中的系统状态有关系统的状态。每个代理记录其混合策略,即它对在下一期间在下一期间播放的信念,在此共享心理模型中,在此共享心理模型中使用MWU内部更新而没有对实际行为的任何改变,直到它平衡,从而标记其与第二天的真实结果一致。然后,只有那个代理在现实世界中采取行动,有效地在第二天的系统状态的“全面知识”,即它们是克莱师。CMWU有效充当MWU一天展望,实现有界遗憾。在技术水平,我们建立了任何选择的阶梯大小的自我一致的心理模型,并在其唯一性和线性时间计算的阶梯大小上提供界限收缩映射参数。我们的论点超越正常的游戏,几乎没有努力。
translated by 谷歌翻译
在博弈论中的精髓结果是von Neumann的Minmax定理,这些定理使得零和游戏承认基本上独特的均衡解决方案。古典学习结果对本定理构建,以表明在线无后悔动态会聚到零和游戏中的时间平均意义上的均衡。在过去几年中,一个关键的研究方向专注于表征这种动态的日常行为。一般结果在这个方向上表明,广泛的在线学习动态是循环的,并且在零和游戏中正式的Poincar {e}复发。在具有时间不变均衡的定期零和游戏的情况下,我们分析了这些在线学习行为的稳健性。该模型概括了通常的重复游戏制定,同时也是参与者之间反复竞争的现实和自然模型,这取决于外源性环境变化,如日期效果,周到一周的趋势和季节性。有趣的是,即使在最简单的这种情况下,也可能失败的时间平均收敛性,尽管有均衡是固定的。相比之下,使用新颖的分析方法,我们表明Poincar \'{E}尽管这些动态系统的复杂性,非自主性质,但是普及的复发概括。
translated by 谷歌翻译
持续学习的现有工作(CL)的重点是减轻灾难性遗忘,即学习新任务时过去任务的模型绩效恶化。但是,CL系统的训练效率不足,这限制了CL系统在资源有限的方案下的现实应用。在这项工作中,我们提出了一个名为“稀疏持续学习”(SPARCL)的新颖框架,这是第一个利用稀疏性以使边缘设备上具有成本效益的持续学习的研究。 SPARCL通过三个方面的协同作用来实现训练加速度和准确性保护:体重稀疏性,数据效率和梯度稀疏性。具体而言,我们建议在整个CL过程中学习一个稀疏网络,动态数据删除(DDR),以删除信息较少的培训数据和动态梯度掩盖(DGM),以稀疏梯度更新。他们每个人不仅提高了效率,而且进一步减轻了灾难性的遗忘。 SPARCL始终提高现有最新CL方法(SOTA)CL方法的训练效率最多减少了训练失败,而且令人惊讶的是,SOTA的准确性最多最多提高了1.7%。 SPARCL还优于通过将SOTA稀疏训练方法适应CL设置的效率和准确性获得的竞争基线。我们还评估了SPARCL在真实手机上的有效性,进一步表明了我们方法的实际潜力。
translated by 谷歌翻译
本文提出了一种转移学习方法,以重新校准我们先前开发的车轮探针神经网络(WHONET),以在全球导航卫星系统(GNSS)不可用的环境中进行车辆定位。已显示WHONET具有学习车轮速度测量中不确定性的能力,以校正和准确的车辆定位。这些不确定性可能表现为轮胎压力从泥泞和不平坦的地形或车轮滑动中的驾驶变化。但是,关注数据驱动方法(例如WHONET模型)的共同原因通常是无法将模型推广到新车。在机器学习模型在特定领域进行培训但部署在另一个领域的情况下,该模型的性能降低了。在现实生活中,从变化到车辆的动力学到传感器噪声的新模式分布,有几个因素对这种降解有影响,偏见会使测试传感器数据的数据因训练数据而异。因此,挑战是探索允许训练有素的机器学习模型自发适应新车辆域的技术。因此,我们提出了重新校准的轮循环神经网络(R-WHONET),该神经网络将WHONET模型从其源域(最初训练该模型的车辆和环境)适应到目标域(一种新车辆,在其上进行了训练)。训练有素的模型将被部署)。通过在几个GNSS中断场景上进行性能评估 - 短期复杂驾驶方案以及长期GNSS中断方案。我们证明,在源域中训练的模型并不能很好地推广到目标域中的新车辆。但是,我们表明,我们的新提议的框架将WHONET模型对目标域中的新车辆的概括提高了32%。
translated by 谷歌翻译
条件神经过程(CNP; Garnelo等,2018a)是元学习模型,它利用深度学习的灵活性来产生良好的预测,并自然处理网格和缺失的数据。 CNPS缩放到大型数据集并轻松训练。由于这些功能,CNP似乎非常适合来自环境科学或医疗保健的任务。不幸的是,CNP不会产生相关的预测,从而使它们从根本上不适合许多估计和决策任务。例如,预测热浪或洪水需要在时间和空间中对温度或降水的依赖性进行建模。建模输出依赖性的现有方法,例如神经过程(NPS; Garnelo等,2018b)或FullConvgNP(Bruinsma等,2021),要么是复杂的训练或过于昂贵的。需要的是一种提供依赖预测的方法,但可以易于训练和计算障碍。在这项工作中,我们提出了一类新的神经过程模型,这些模型可以简单且可扩展,从而提供相关的预测并支持确切的最大似然训练。我们通过使用可逆输出转换来扩展提出的模型,以捕获非高斯输出分布。我们的模型可以用于需要相关功能样本的下游估计任务中。通过考虑输出依赖性,我们的模型在合成和真实数据的一系列实验上显示出改进的预测性能。
translated by 谷歌翻译
在车辆场景中的毫米波链路的光束选择是一个具有挑战性的问题,因为所有候选光束对之间的详尽搜索都不能在短接触时间内被确认完成。我们通过利用像LIDAR,相机图像和GPS等传感器收集的多模级数据来解决这一问题。我们提出了可以在本地以及移动边缘计算中心(MEC)本地执行的个人方式和分布式融合的深度学习(F-DL)架构,并研究相关权衡。我们还制定和解决优化问题,以考虑实际的光束搜索,MEC处理和传感器到MEC数据传送延迟开销,用于确定上述F-DL架构的输出尺寸。在公开的合成和本土现实世界数据集上进行的广泛评估结果分别在古典RF光束上释放出95%和96%的束选择速度提高。在预测前10个最佳光束对中,F-DL还优于最先进的技术20-22%。
translated by 谷歌翻译
在本文中,提出了一种深入的学习方法,可以在全球导航卫星系统(GNSS)剥夺环境中精确定位轮式车辆。在没有GNSS信号的情况下,可以使用关于从车轮编码器记录的车辆(或其他机器人相似的车轮)速度的信息来通过车辆的线性速度的整合来提供用于车辆的连续定位信息流离失所。然而,来自车轮速度测量的位移估计的特征在于不确定因素,其可以表现为车轮滑动或/和对轮胎尺寸或压力的变化,从潮湿和泥泞的道路驱动器或轮胎佩戴。因此,我们利用深度学习的最近进步提出了车轮内径神经网络(WHONET)来学习校正和准确定位所需的车轮速度测量中的不确定性。首先在若干具有挑战性的驾驶场景中评估所提出的WHONET的性能,例如环形交叉路口,锋利的转弯,硬制动和湿路(漂移)。然后,在长期GNSS中断场景中进一步且广泛地评估WHONET的性能,分别在493km的总距离上的长期GNSS中断场景。获得的实验结果表明,在任何180多个行驶之后,所提出的方法能够准确地定位其原始对应物的定位误差高达93%的车辆。 Whonet的实现可以在https://github.com/onyekpeu/whonet找到。
translated by 谷歌翻译
神经网络是人工智能的巅峰之作,因为近年来我们目睹了许多新颖的体系结构,学习和优化技术的深度学习。利用这一事实是,神经网络固有地构成神经元之间的多部分图,我们旨在直接分析其结构,以提取有意义的信息,以改善学习过程。对于我们的知识图挖掘技术,尚未对神经网络中的学习进行增强。在本文中,我们为从深度学习体系结构中提取的完整加权多部分图的K核结构提出了一个改编版本。由于多方图是两分图的组合,而两分图的组合是超图的起点图,因此我们设计了k-hypercore分解,这是k核退化性的超图类似物。我们将K-Hypercore应用于几个神经网络体系结构,更具体地用于卷积神经网络和多层感知,以进行非常短的训练后的图像识别任务。然后,我们使用了由神经元的超核数量提供的信息来重新定位神经网络的权重,从而偏向梯度优化方案。广泛的实验证明,K-Hypercore的表现优于最新初始化方法。
translated by 谷歌翻译
Multiple lines of evidence strongly suggest that infection hotspots, where a single individual infects many others, play a key role in the transmission dynamics of COVID-19. However, most of the existing epidemiological models fail to capture this aspect by neither representing the sites visited by individuals explicitly nor characterizing disease transmission as a function of individual mobility patterns. In this work, we introduce a temporal point process modeling framework that specifically represents visits to the sites where individuals get in contact and infect each other. Under our model, the number of infections caused by an infectious individual naturally emerges to be overdispersed. Using an efficient sampling algorithm, we demonstrate how to estimate the transmission rate of infectious individuals at the sites they visit and in their households using Bayesian optimization and longitudinal case data. Simulations using fine-grained and publicly available demographic data and site locations from Bern, Switzerland showcase the flexibility of our framework. To facilitate research and analyses of other cities and regions, we release an open-source implementation of our framework.
translated by 谷歌翻译